寻找两人差异游戏的NASH平衡政策需要解决汉密尔顿 - 雅各布-ISAACS PDES。最近的研究通过采用自我监督(物理知识的)神经网络作为通用价值近似值,在解决这种PDE方面的诅咒方面取得了成功。本文从具有连续值的零和零游戏上的SOTA延伸到具有不连续值的通用游戏,其中不连续性是由玩家的损失引起的。我们表明,由于缺乏对不连续损失的融合证明和概括分析,现有的自我监督学习技术未能概括并引起自动驾驶应用程序中的安全问题。我们的解决方案是首先先预先培训纳什平衡的价值网络,然后通过最大程度地减少将监督数据与PDE和边界条件相结合的损失来对其进行完善。重要的是,提出的学习方法的证明优势针对纯监督和自我监督的方法需要仔细选择神经激活功能:在$ \ texttt {relu} $中} $,我们表明$ \ texttt {tanh} $是实现最佳概括和安全性能的唯一选择。我们的猜想是$ \ texttt {tanh} $(类似于$ \ texttt {sin} $)允许价值连续性及其梯度,这足以满足学习的收敛性,同时也足够表达(类似于$ \ texttt {relu} $)以近似值的价值景观。最后,我们将我们的方法应用于近似控制策略的不完整信息相互作用,并证明了其对安全相互作用的贡献。
translated by 谷歌翻译
由于交通环境的复杂性和波动性,自主驾驶中的决策是一个显着难的问题。在这个项目中,我们使用深度Q-network,以及基于规则的限制来使车道变化的决定。可以通过将高级横向决策与基于低级规则的轨迹监视相结合来获得安全高效的车道改变行为。预计该代理商在培训中,在实际的UDAcity模拟器中进行了适当的车道更换操作,总共100次发作。结果表明,基于规则的DQN比DQN方法更好地执行。基于规则的DQN达到0.8的安全速率和47英里/小时的平均速度
translated by 谷歌翻译
This paper proposes a novel self-supervised based Cut-and-Paste GAN to perform foreground object segmentation and generate realistic composite images without manual annotations. We accomplish this goal by a simple yet effective self-supervised approach coupled with the U-Net based discriminator. The proposed method extends the ability of the standard discriminators to learn not only the global data representations via classification (real/fake) but also learn semantic and structural information through pseudo labels created using the self-supervised task. The proposed method empowers the generator to create meaningful masks by forcing it to learn informative per-pixel as well as global image feedback from the discriminator. Our experiments demonstrate that our proposed method significantly outperforms the state-of-the-art methods on the standard benchmark datasets.
translated by 谷歌翻译
Post-hoc explanation methods have become increasingly depended upon for understanding black-box classifiers in high-stakes applications, precipitating a need for reliable explanations. While numerous explanation methods have been proposed, recent works have shown that many existing methods can be inconsistent or unstable. In addition, high-performing classifiers are often highly nonlinear and can exhibit complex behavior around the decision boundary, leading to brittle or misleading local explanations. Therefore, there is an impending need to quantify the uncertainty of such explanation methods in order to understand when explanations are trustworthy. We introduce a novel uncertainty quantification method parameterized by a Gaussian Process model, which combines the uncertainty approximation of existing methods with a novel geodesic-based similarity which captures the complexity of the target black-box decision boundary. The proposed framework is highly flexible; it can be used with any black-box classifier and feature attribution method to amortize uncertainty estimates for explanations. We show theoretically that our proposed geodesic-based kernel similarity increases with the complexity of the decision boundary. Empirical results on multiple tabular and image datasets show that our decision boundary-aware uncertainty estimate improves understanding of explanations as compared to existing methods.
translated by 谷歌翻译
在线学习系统具有成绩单,书籍和问题形式的多个数据存储库。为了易于访问,此类系统会根据层次性质(主题 - 主题)的明确分类法组织内容。将输入分类为层次标签的任务通常被视为平坦的多类分类问题。这种方法忽略了输入中的术语与层次标签中的令牌之间的语义相关性。当它们仅将叶片节点视为标签时,替代方法也患有类不平衡。为了解决这些问题,我们将任务制定为一个密集的检索问题,以检索每个内容的适当层次标签。在本文中,我们处理问题。我们将层次标签建模为其令牌的组成,并使用有效的交叉注意机制将信息与内容术语表示融合。我们还提出了一种自适应内部的硬采样方法,随着培训的进行,该方法可以更好地取消负面影响。我们证明了所提出的方法\ textit {tagrec ++}在问题数据集上的现有最新方法均超过了receal@k所测量的现有最新方法。此外,我们演示了\ textit {tagrec ++}的零射击功能以及适应标签更改的能力。
translated by 谷歌翻译
多媒体数据集中的异常检测是一个广泛研究的区域。然而,大多数异常检测框架对数据中的概念漂移挑战被忽略或不良处理。最先进的方法假设培训和部署时间的数据分配将相同。但是,由于各种现实生活中的环境因素,数据可能会在其分布中遇到漂移,或者在未来的后期可能会从一个班级漂移。因此,一次经过训练的模型可能无法充分执行。在本文中,我们系统地研究了概念漂移对各种检测模型的影响,并提出了基于修改的自适应高斯混合模型(AGMM)在多媒体数据中用于异常检测的框架。与基线AGMM相反,提议的AGMM延伸时间记得过去更长的时间,以便更好地处理漂移。广泛的实验分析表明,与基线AGMM相比,提出的模型可以更好地处理数据的漂移。此外,为了促进与提议的框架进行研究和比较,我们贡献了三个构成面孔作为样本的多媒体数据集。个体的面部样本对应于十年以上的年龄差异,以纳入更长的时间背景。
translated by 谷歌翻译
本文介绍了代数单词问题评分释义的新任务(AWP),并提出了一种自我监督的方法。在当前的在线教学环境中,释义这些问题对于院士来说有助于产生多种句法的问题以进行评估。它还有助于引起变化,以确保学生已经理解问题,而不仅仅是记住问题或使用不公平的手段来解决问题。当前的最新释义生成模型通常无法有效地解释单词问题,失去关键信息(例如数字或单位),这使问题无法解决。在AWP的背景下,需要释义方法来训练良好的释义者。因此,我们提出了使用新型数据增强的一种自我监督的解释质量检测方法ParaqD,可以学习潜在表示,以通过广泛的利润将代数问题与贫穷的问题分开。通过广泛的实验,我们证明我们的方法的表现优于现有的最先进的自我监管方法,高达32%,同时也证明了令人印象深刻的零拍性能。
translated by 谷歌翻译
多媒体异常数据集在自动监视中发挥着至关重要的作用。它们具有广泛的应用程序,从异常对象/情况检测到检测危及生命事件的检测。该字段正在接收大量的1.5多年的巨大研究兴趣,因此,已经创建了越来越多地专用于异常动作和对象检测的数据集。点击这些公共异常数据集使研究人员能够生成和比较具有相同输入数据的各种异常检测框架。本文介绍了各种视频,音频以及基于异常检测的应用的综合调查。该调查旨在解决基于异常检测的多媒体公共数据集缺乏全面的比较和分析。此外,它可以帮助研究人员选择最佳可用数据集,用于标记框架。此外,我们讨论了现有数据集和未来方向洞察中开发多峰异常检测数据集的差距。
translated by 谷歌翻译
在本文中,正在研究精神任务 - 根脑 - 计算机接口(BCI)的分类,因为这些系统是BCI中的主要调查领域,因为这些系统可以增强具有严重残疾人的人们的生命。 BCI模型的性能主要取决于通过多个通道获得的特征向量的大小。在心理任务分类的情况下,培训样本的可用性最小。通常,特征选择用于通过摆脱无关紧要和多余的功能来增加心理任务分类的比率。本文提出了一种为精神任务分类选择相关和非冗余频谱特征的方法。这可以通过使用四个非常已知的多变量特征选择方法VIZ,BHATTACHARYA的距离,散射矩阵的比率,线性回归和最小冗余和最大相关性。这项工作还涉及对心理任务分类的多元和单变量特征选择的比较分析。在应用上述方法后,研究结果表明了精神任务分类的学习模型的性能的大量改进。此外,通过执行稳健的排名算法和弗里德曼的统计测试来认识所提出的方法的功效,以找到最佳组合并比较功率谱密度和特征选择方法的不同组合。
translated by 谷歌翻译
有限的作品显示无监督的分布(OOD)方法对复杂的医疗数据的功效。在这里,我们展示了我们无监督的OOD检测算法,SIMCLR-LOF的初步调查结果,以及在医学图像上应用的最近现实方法(SSD)的最新状态。SIMCLR-LOF使用SIMCLR学习语义有意义的功能,如果测试样本是ood的,则使用LOF进行评分。我们在多源国际皮肤成像协作(ISIC)2019数据集上进行了评估,并显示与SSD竞争的结果以及应用于同一数据的最近监督方法。
translated by 谷歌翻译